amd推土机模块化架构是否过度被贬低?

您所在的位置:网站首页 fx8350 cpu amd推土机模块化架构是否过度被贬低?

amd推土机模块化架构是否过度被贬低?

2023-03-11 07:21| 来源: 网络整理| 查看: 265

我不认为有过度贬低,因为单就推土机这个架构来说,他确实是失败的,虽然它的思路很清奇,但是不妨碍出来的产品很烂

先来看一下推土机的架构嘛

前端应该算四解码,但是是复杂还是简单的解码以及怎么分配的我暂时不知道

严格来说这也是一种整数浮点分离式设计,和现在的ZEN/ZEN2/ZEN3也有点像,但是实际上推土机是两个核心整合成了一个模块,或者说一个模块可以被分成两个核心,两个整数部分一个浮点部分,两个核心贡献一个浮点模块,据说当时AMD认为浮点功能交给GPU就好了,CPU应该更加注重整数性能

像FX9590这种CPU虽然宣传是八核心八线程,但是叫四模块八线程更好,一个模块拥有两个子核心,单独一个子核心承担一个线程的任务,

但是仔细看一下推土机的整数部分,只能说规模太小了,两个AGU两个ALU,这个规模甚至不如K10

K10的整数部分都拥有三个ALU三个AGU,虽然不方便直接和现在的比,但是对于当时同时代的推土机而言是可以直接比较的,

简单的来说,就是做整数计算的时候,单个推土机小核心对应模块的计算单元只有K10的2/3,在其他方面没有形成吊打局势的时候,计算单元更少那肯定性能会更低,

然后来看一下浮点部分,推土机宽度128bit,而同时期的intel已经是256bit了,拥有两个fp unit,这倒不算多,利用率应该也够看

如果要进行AVX浮点计算,那么推土机一个模块最高只能实现单256FMA的计算,而Haswell却已经可以单核心实现2*256 FMA了(加法依旧是单),不过SNB和IVB没有FMA,所以乘加峰值这里和推土机一样,但是前面也说了推土机这是两个核心的共用资源,均摊起来就弱了

而ZEN架构则在整数逻辑上是4x128bit,推土机是2x128bit,ZEN的浮点乘加融合峰值达到4x128bit,推土机只有2x128bit,不过这俩整数乘加、浮点单独乘加以及FMA都是2x128bit,但是也足够在运行SIMD位宽128bit的程序的时候ZEN1降维打击推土机,如果推土机不是单模块双核心的话也许还能拉回一点差距

整数弱,浮点弱,就连K10都打不过

主要是推土机这个设计就和如今入流的小核心一样,如今不管是X86还是ARM的小核心也基本上是重整数性能轻浮点性能,但是这样设计的是因为有大核心可以提供足够强的浮点性能,小核用于一些轻度负载的时候提高可观的整数性能即可,日常使用中很多软件会更加吃整数性能,并且我也确实有看见推土机使用者向我吐槽推土机日常使用会有卡顿的现象,

而K10则完完全全是一个大核心设计,或者说满血核心的设计,和如今的主流高IPC架构是一个思路

Ryzen的三代新架构,我个人觉得更像K10,而不是推土机,这就直接看架构图就知道了

ZEN架构左ZEN2 右ZEN3

这要是在K10和推土机之间认亲,那必然是K10更合适啊,都是一个整数模块一个浮点模块并且一起组成一个核心的部分,妥妥的大核心设计,哪里还有推土机那单模块双小核心的思路啊

你要说CCX模块和推土机模块明明更像,我倒觉得名字可能更像一点,都是模组化思路倒也还说的过去一些

推土机的模块是把两个架构整合起来,可以说是微架构层面的模块化设计,你模块化的是微架构

而CCX模块则更像是不是微架构层面上的模块化设计,你模块化的是多个具体的核心,甚至连L3都放在CCX模块里面,这样做是更加方便堆Die

不过当时的32nm制程也确实是拖累了AMD,

没有办法在单位规模内堆更多的计算单元和更大的Buffer,苹果的小核以及intel的Tremont、未来的Gracemont都证明了即使是小核心那也可以拥有可观的IPC,但前提是你堆得上去,当然优化延迟、提高分支预测准确率之类的事情也不能少,

32nm本身就落后当时同期的intel 22nm一代,这里可能能耗比就差一些了,FX9590还拉了非常高的频率,拉高频率势必会带动功耗猛涨,intel当时主流产品的频率又明显更低一些,所以进一步显得推土机就是高功耗低性能而酷睿系列则是低功耗高性能。

RKL虽然也惨但是比推土机还是好一些,因为RKL也确实是拉高频率了功耗也上来了,但是起码性能也提高了,IPC对比Skylake更高,单核性能也高于十代,同频性能高于十代

而推土机则是在功耗更高的基础上,性能也不高,IPC不如K10的产品,同频性能弱于K10,也远弱于当时的SNB/IVB/HSW,但是由于拉高了频率盖过了IPC劣势所以最终单核性能比起前代来说表现也还算是高了。

以前确实多线程优化不够好,可是现在就足够好了吗?现在ZEN3都出来了,谁还去等你的推土机战未来啊,我随便换一个现在的四核以上主流CPU都吊打推土机。

至于说“ 优化起来之后fx8350其实根本不虚当年对标的i5-4590 ”,可以明确多线程性能方面肯定是不虚的,毕竟FX8350的规模在这里的,不过多核也是由单核组成的,不是什么软件都和渲染一样。而i5 4590也仅仅是当初的一个小小的4C4T产品罢了,并且再优化也是把多核性能拉上来,单核性能依旧是推土机的痛,这是它刻在基因(微架构)里的弱势。还有就是如果涉及浮点性能需求较大的应用推土机也会很难受,浮点性能弱啊就只能挨打站稳了。

618专属红包来了↓大家可以领一下:

拓展阅读:

持续更新的台式机硬件购买指北

公众号:硬糖的硬件树屋,每天晚上更新新鲜有趣的硬件信息


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3